<meta http-equiv="refresh" content="0; URL=https://mobile.twitter.com/i/nojs_router?path=/i/moments/845895221728591872"> お金の分布としての指数分布とガンマ分布(続き)

キーボードショートカット

キーボードのショートカットは共通のアクションとサイト内のナビゲーションに使用できます。

コンテンツをスキップ

お金の分布としての指数分布とガンマ分布(続き)

モーメント「お金の分布としての指数分布とガンマ分布」(https://twitter.com/i/moments/845118009425342464) への補足説明
編集
編集

リンク先の単にランダムにお金をやりとりするだけの世界の話について補足。続く

1件の返信 10件のリツイート 25 いいね
返信先: さん

人数Nは大きいとし、お金の総量MをNで割った値a=M/N>0はNによらないと仮定しておきます。各人の保有するお金m_iの総和がMになるという条件の下で等確率条件を仮定(ランダムにお金のやりとりをしていると仮定)すると〜続く

1件の返信 2件のリツイート 2 いいね
返信先: さん

続き〜、各人の保有するお金がmになる確率は近似的にe^{-m/a}に比例するようになります。すなわち、各人が保有するお金の量が指数分布に近似的に従うようになります。これは数学的には統計力学におけるカノニカル分布の特別な場合とみなせます。続く

1件の返信 2件のリツイート 3 いいね
返信先: さん

現実世界でも、各人の貯金の量は指数分布に近似的に従っているようにも見える。続く

1件の返信 2件のリツイート 3 いいね
返信先: さん

統計力学におけるカノニカル分布を体験してもらうために、おもちゃのお金を配ってランダムにお金をやりとりさせると、指数分布が現れることを確認する授業をやっている人もいるらしいです。(本当の話をするとよく知りません。)続く

1件の返信 1件のリツイート 3 いいね
返信先: さん

指数分布はあまりにも不平等なので、なんとか平等に近付けたいと仮に思ったとしましょう。そのためには、ある種の効用の総和に下限を設けるという手段が(数学的には)使えます。お金mから得られる各人の効用はlog mだと仮定しましょう。続く

1件の返信 2件のリツイート 3 いいね
返信先: さん

続き。logは上に凸な単調増加函数の例としてよく使われます。相加相乗平均の不等式もしくはJensenの不等式より、各人の効用log m_iの平均値はlog a以下になります(aはm_iの平均値でした)。効用log m_iの平均値がlog aになるのは〜続く

1件の返信 1件のリツイート 3 いいね
返信先: さん

続き〜、全ての人が持つお金が等しくaになる完全平等状態です。そこまで極端ではなく、0<b<aであるとし、「効用log m_iの平均値はlog b以上である」という制限の下でランダムにお金やりとりをさせたらどうなるでしょうか?m_iの平均値はaで一定であるとします。続く

1件の返信 2件のリツイート 3 いいね
返信先: さん

続き。そのとき各人の保有するお金がmになる確率は近似的にexp(-m/μ+(λ-1)log m)に比例するようになります。すなわち近似的にガンマ分布に従うようになる。μとλはaとbからλμ=a,log μ+Γ'(λ)/Γ(λ)=log bで決まります。

1件の返信 3件のリツイート 3 いいね
返信先: さん

続き∫_0^∞ e^{-x/μ}x^{λ-1}dx=Γ(λ)μ^λ(1/Γ(λ)μ^λ)∫_0^∞ e^{-x/μ}x^{λ-1}x dx=λμ(1/Γ(λ)μ^λ)∫_0^∞ e^{-x/μ}x^{λ-1}log x dx=log μ+Γ'(λ)/Γ(λ)

1件の返信 2 いいね
返信先: さん

続き。すなわち、λμ=a、log μ+Γ'(λ)/Γ(λ)=log bはガンマ分布する確率変数X(今の場合は各人が保有するお金の量)について、(Xの平均)=a(log Xの平均)=log bを意味しています。続く

1件の返信 1 いいね
返信先: さん

続き。b_0(a)をlog a+Γ'(1)=log b_0(a)、Γ'(1)=-γ=-0.5772…と定め、以下b_0(a)≦b≦aと仮定します。人数をNとする。お金の総量をΣm_i=Naとし、効用の総和をΣ log m_i≧N log b と~続く

1件の返信 1 いいね
返信先: さん

続き~制限して、ランダムにお金をやりとりしまくると、各人が保有するお金の量はa,bから定めたパラメータλ≧1,μ>0に関するΓ分布に近似的に従い、指数分布より「平等」な状態が確率的に実現されます。

1件の返信 1 いいね
返信先: さん

今のケースでは統計力学での逆温度にあたるパラメータが2つあって、1/μ>0と1-λ≦0の2つが逆温度にあたるパラメータです。後者が負になっていることに注意。

1件の返信 1件のリツイート 3 いいね
返信先: さん

逆温度にあたるパラメータβが負になるケースも含めた議論が私のノートに書いてあります→ (特に第4節)

1件の返信 2件のリツイート 4 いいね
返信先: さん

問題:等確率の原理が崩されないようなランダムにお金をやりとりするルールで、「お金の総量がNaで一定」と「log型効用の総和がN log b以上」という条件を満たす扱いやすいもの(教室内の実験で使えるもの)を見つけよ。

1件の返信 3件のリツイート 5 いいね
返信先: さん

この問題が解ければ、log型効用の総和に下限を設ければ、自然に指数分布より平等なガンマ分布が確率的に勝手に実現してしまうという実験が教室内でできます。

1件の返信 1件のリツイート 2 いいね
返信先: さん

お金の総量一定でランダムにお金をやりとりすると、個人保有のお金の量の分布が指数分布に近付く統計的な力が働きます(条件付き大数の法則)。効用の総和に下限を設けるとによって指数分布に近付くことを妨げると指数分布とは異なる分布に近付くことになります。これはそういう話。

1件の返信 3件のリツイート 6 いいね
返信先: さん

この辺のことは相対エントロピー(Kullback-Leibler情報量)に関するSanovの定理がどういう結果であるかを直観的に理解すれば、当たり前の話に感じるようになります。

1件の返信 1件のリツイート 3 いいね
返信先: さん

上の方で出て来たγ=-Γ'(1)=0.5772…は所謂オイラー定数です。円周率や自然対数の底の次くらいによく出て来る感じ。この手のことに慣れていない人はWolframAlphaに慣れると良いと思います。便利だし、勉強になります。

2件の返信 1件のリツイート 4 いいね
返信先: さん

あとΓ(s)=∫_0^∞ e^{-x}x^{s-1}dxはガンマ函数。ベータ函数とともに、指数函数、対数函数、三角函数の次くらいによく出て来る。高校で教えた方がいいんじゃないかと思えるくらい、数学を使うとよく出て来ます。知らないと統計がらみの話はついて行けなくなる。

1件の返信 2件のリツイート 8 いいね
返信先: さん

添付画像は平均1の指数分布のグラフです。λ=1/μ=1の場合。正規化していないので、縦軸の目盛りは無視来てください。保有するお金の量が小さいほど確率が高くなる。現実の貯金の分布もこんな感じ。

1件の返信 3件のリツイート 5 いいね
返信先: さん

平均は1のままだが、λ=2としたガンマ分布のグラフ。λ=1/μ=2の場合。お金を全然持っていない人が減っている。縦軸の目盛りは無視してください。

1件の返信 3件のリツイート 4 いいね
返信先: さん

平均は1のままでλ=10とした場合。縦軸の目盛りは無視して下さい。相当に平等社会になっている。

1件の返信 3件のリツイート 5 いいね
返信先: さん

リンク先の「統計的な力」の自明な例は大数の法則です。たとえば、表と裏が同じ確率で出るコインを投げ続けたら、出た表の数と裏の数の比は1対1に近付きます。まるで表の数と裏の数の比が等しくなる力が働いているように錯覚できる。続く

1件の返信 1件のリツイート 2 いいね
返信先: さん

続き。もっと複雑な分布の場合でも同様に自明な(大数の法則による)「統計的な力」が働いていると思うことができます。たとえば1からrまでの目がそれぞれq_1,…,q_rで出るルーレットを何度も回し続ければ、1からrまでの目が出た数の比はq_1:…:q_rに近付きます。続く

1件の返信 2 いいね
返信先: さん

続き。連続な確率分布の場合も同様のことが成立します。例えば指数分布に従っている乱数を何度も出し続ければ経験分布は指数分布に近付きます。続く

1件の返信 2 いいね
返信先: さん

続き。以上のような単純な大数の法則による「統計的な力」は確率の概念を正しく理解している人にとっては自明過ぎてつまらないと感じられると思う。非自明で面白いのは「条件付き大数の法則」です。続く

1件の返信 2 いいね
返信先: さん

続き。たとえば、自由にお金をランダムにやりとりするとお金の分布が指数分布になる状況に「効用の総和がある定められた下限以上になる」という条件を課して確率分布をガンマ分布に変えるというようなことができるわけです。こちらの話は非自明で面白い話だと思います。

1件の返信 1件のリツイート 4 いいね
返信先: さん

一般に以下が成立しています。まず、制限抜きの確率分布(確率密度函数)はq(x)だとします。何の制限も付けないと乱数xが分布q(x)に従って生成される。次に、f(x)はxの任意の函数であり、分布q(x)に関するf(x)の平均をc_0と書きましょう。続く

1件の返信 3 いいね
返信先: さん

続き。c<c_0 のとき、分布q(x)に従って、N回乱数x_1,…,x_Nを発生させ、(f(x_1)+…+f(x_N))/N≦cが成立する場合以外を全て捨て去ると、Nが大きいとき~続く

1件の返信 2 いいね
返信先: さん

続き~、そのように制限された乱数列x_1,…,x_Nはまるで確率分布p_β(x)=e^{-βf(x)}q(x)/Z(β)に近似的に従っているかのように振る舞います!ここで、Z(β)=∫e^{-βf(x)}q(x)dx、⌠f(x)p_β(x)dx=cです。続く

1件の返信 2 いいね
返信先: さん

続きc>c_0の場合には、分布q(x)に従ってN回乱数x_1,…,x_Nを発生させ、(f(x_1)+…+f(x_N))/N≧cが成立する場合以外を全て捨て去ると、Nが大きいとき~続く

1件の返信 1 いいね
返信先: さん

続き~、そのように制限された乱数列x_1,…,x_Nはまるで確率分布p_β(x)=e^{-βf(x)}q(x)/Z(β)に近似的に従っているかのように振る舞います!ここで、Z(β)=∫e^{-βf(x)}q(x)dx、⌠f(x)p_β(x)dx=cです(βは負になる)。

1件の返信 1 いいね
返信先: さん

続き。c<c_0のときβは正になり(この場合が統計力学に出て来る)、c>c_0のときβは負になります(βが負の場合を扱った説明が確率論の文献によくあります)。逆温度βは負になっても全然問題ない。

1件の返信 1 いいね
返信先: さん

例えば、q(x)=e^{-x/a}/a (a>0、指数分布)のケースで、f(x)=log xのとき、c_0=(1/a)⌠_0^∞ e^{-x/a} log x dx=log a-γ (γはオイラー定数)であり、c=log b<log a-γと仮定すると、続く

1件の返信 1 いいね
返信先: さん

続き、q(x)が生成する乱数x_1,…,x_Nを(log x_1+…+log x_N)/N≧c=log bの場合に制限すると、x_1,…,x_Nは分布p_β(x)=e^{-β log x}e^{-x/a}/Z(β)に近似的に従っているかのように振る舞います。続く

1件の返信 1 いいね
返信先: さん

続き。ここでZ(β)=∫_0^∞ e^{-β log x}e^{-x/a} dx=∫_0^∞ e^{-x/a}x^{-β} dx=Γ(1-β)a^{1-β}であり、⌠_0^∞ p_β(x) log x dx=c=log bでβを決めます。βは負になる。続く

1件の返信 2 いいね
返信先: さん

続き。こんな感じのことが色々できる。

1件の返信 1 いいね
返信先: さん

数十分前に書いたやつを見直すとまるで暗号だな。

1件の返信 4 いいね
返信先: さん

現在 にアクセスできなくなっています。最近ずっと使いまわしている解説のコピーを以下の場所に置いておきました。

1件の返信 1件のリツイート 3 いいね